سامانۀ رفع ابهام معنایی از حروف اضافه در زبان فارسی با استفاده از قالبهای معنایی
نویسندگان
چکیده مقاله:
رفع ابهام معنایی از کلمات در بافت یکی از مهمترین چالشها در حوزۀ پردازش زبان طبیعی و زبانشناسی رایانشی است. در این میان حروف اضافه، بهخصوص در زبان فارسی، در پژوهشهای مربوط به رفع ابهام معنایی همواره نادیده انگاشته شدهاند. ازاینرو، پژوهش حاضر قصد دارد با ارائۀ الگوریتمی جدید مبتنی بر قالبهای معنایی، سامانهای قاعدهمند جهت رفع ابهام معنایی از حروف اضافه «از»، «در»، «با» و «تا» در زبان فارسی ارائه دهد. روش به کار گرفتهشده در این پژوهش و الگوریتم پیشنهادی منحصربهفرد است. دادگان مورداستفاده در این پژوهش شامل 1000 جمله دادۀ آموزشی، 100 جمله دادۀ توسعه و 500 جمله دادۀ تست است که از منابع اینترنتی و شبکههای اجتماعی همچون یوتیوب جمعآوری گردیده است. جهت انجام کار، تمام حروف اضافه موردنظر پژوهش برچسبدهی معنایی شده و برای آنها در پیکرۀ آموزشی، قالبهای معنایی بر اساس زبان قالب بنیاد مینسکی (1975) تعریف شدند. همچنین برای کلمات قبل و بعد حروف اضافه در پیکره نیز قالبهایی تهیه و در فایل داده مدخلها وارد سامانه گردیدند. الگوریتم پژوهش در سه مسیر با استفاده از اطلاعات موجود در قالبها، اقدام به تعیین معنای حروف اضافه در جملات میکند. نتایج آزمایشهای دادۀ تست، نشان دهندۀ دقت بالای عملکرد سامانه (16/99%) در رفع ابهام معنایی از حروف اضافه در زبان فارسی است.
منابع مشابه
رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA
Word sense disambiguation is the task of identifying the correct sense for the word in a given context among a finite set of possible sense. In this paper a model for farsi word sense disambiguation is presented. The model use two group of features: first, all word and stop words around target word and topic models as second features. We extract topics from a farsi corpus with Latent Dirichlet ...
متن کاملرفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی lda
ابهام زدایی از واژگان مبهم و دارای معانی متعدد موضوع مهمی در حوزه ی پردازش زبان های طبیعی می باشد. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی بر اساس استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با بکار بردن روش های مدل سازی موضوع بدست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده ...
متن کاملبررسی معنایی و دسته بندی حروف اضافه زبان فارسی بر پایه نظریه لیبر
لیبر (2004 & 2009) نظریه ای تجزیه مدار با هفت مؤلفۀ معنایی و یک اصل به نام اصل هم نمایگی ارائه کرده است. در این نظریه هر عنصر زبانی یک اسکلت معنایی و یک بدنۀ معنایی دارد. اسکلت از یک یا چند مؤلّفه معنایی و یک یا چند موضوع ساخته می شود. بدنۀ معنایی دو لایه دارد: 1. لایه ای که مانند اسکلت از یک گویشور به گویشوری دیگر نسبتاً ثبات دارد و می توان آن را نشان داد؛ 2. لایه ای که اطلاعاتِ کلی و دانش فرهنگ ...
متن کاملنقشهای معنایی حرف اضافة «از» در زبان فارسی
زبان به مانند موجودی زنده در طی زمان، دستخوش تغییر و تحوّلات میگردد و بررسی ویژگیهای آن در صورت کنونی بدون در نظر گرفتن تغییرات درزمانی، پژوهشی ناقص و نارساست. در این مقاله، نقشهای معنایی حرف اضافة «از» در زبانهای اوستایی، فارسی باستان، فارسی میانه، پارتی، فارسی دری و فارسی امروز، با استفاده از دادههای دستور این زبانها و نیز واژهنامههای هر یک بررسیشدهاست. «از» در زبان اوستایی و فارسی ...
متن کاملکارکردهای معنایی و دستوریِ حرف اضافۀ «از» در زبان فارسی
با آنکه حروفاضافه به طبقۀ بستهای از واژهها تعلق دارند، اما چندمعنا بودنِ آنها سبب میشود تا کارکردهای معنایی و دستوریِ آنها متنوع باشد. این پژوهش با رویکردی پیکرهبنیاد به بررسیِ توصیفیِ کارکردهای دستوری و معناییِ حرف اضافۀ «از» در زبان فارسی پرداختهاست. برای این منظور، «پیکرۀ گزارههای معنایی زبان فارسی» مورداستفاده قرار گرفته است. در این پیکره که حجمی بالغ بر سی هزار جمله دارد و روابط محمول-مو...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 9 شماره 1
صفحات 99- 117
تاریخ انتشار 2018-06-22
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023